检索结果

期刊

出版年

关键词

Please wait a minute...

选择:

导出引用
EndNote Ris BibTeX

显示/隐藏图片

Select

1. 基于请求与应答通信机制和局部注意力机制的多机器人强化学习路径规划方法

邓辅秦, 官桧锋, 谭朝恩, 付兰慧, 王宏民, 林天麟, 张建民

《计算机应用》唯一官方网站 2024, 44 (2): 432-438. DOI: 10.11772/j.issn.1001-9081.2023020193

摘要（100）

HTML （1）

PDF （1916KB）（57）

为降低多机器人在动态环境下路径规划的阻塞率，基于深度强化学习方法框架Actor-Critic，设计一种基于请求与应答通信机制和局部注意力机制的分布式深度强化学习路径规划方法（DCAMAPF）。在Actor网络，基于请求与应答通信机制，每个机器人请求视野内的其他机器人的局部观测信息和动作信息，进而规划出协同的动作策略。在Critic网络，每个机器人基于局部注意力机制将注意力权重动态地分配到在视野内成功应答的其他机器人局部观测和动作信息上。实验结果表明，与传统动态路径规划方法D^* Lite、最新的分布式强化学习方法MAPPER和最新的集中式强化学习方法AB-MAPPER相比，DCAMAPF在离散初始化环境，阻塞率均值均约降低了6.91、4.97、3.56个百分点；在集中初始化环境下能更高效地避免发生阻塞，阻塞率均值均约降低了15.86、11.71、5.54个百分点，并减少占用的计算缓存。所提方法确保了路径规划的效率，适用于求解不同动态环境下的多机器人路径规划任务。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

2. 基于请求与应答通信机制和局部注意力机制的多机器人强化学习路径规划方法

邓辅秦官桧锋谭朝恩付兰慧王宏民林天麟张建民

《计算机应用》唯一官方网站 DOI: 10.11772/j. issn.1001-9081.2023020193
预出版日期: 2024-01-06